查看原文
其他

吴义龙 | 大数据改变了因果关系吗?

吴义龙 法律和社会科学 2023-12-27

大数据·因果关系



传统的也就是必然性的和确定性的因果关系概念在法律中不断遭遇到各种困境,这不仅来源于社会世界表现出日益的复杂性趋势,更由于从事实上严格证明因果关系存在几乎是不可能的。在大数据时代的背景下,因果关系进一步地转变为相关关系,至少在部分领域已是如此,法律制度对此有必要给予及时回应。


作者:吴一龙,河南大学法学院讲师。原载《法律和社会科学》第15卷第1辑(2016),推送时有删减。



1 背景和问题


因果关系在法学理论和法律实务中是一个重要且困难的问题。说它重要,是因为它涉及责任的确立与否和赔偿范围的大小;说它困难,是因为几乎到处都充斥着各种观念的混乱以及不同争议持续地涌现,以至于“可能在整个法律领域里,再没有其他问题如此混杂着诸多不一致的意见了。而且尽管做过各种努力去澄清最好的途径是哪一种,至今仍然没有在总体上达成一致”。甚至波斯纳认为,在侵权法的经济学分析中,原因的概念在很大程度上可省掉。


这是为什么?理由是多样的。但在笔者看来,其中有两点较突出。一个是语词的本质主义观念在作怪。人们通常认为,语词有一个本质上确定的含义,这一点可通过对语词进行定义来发现。实际上,这是一个错误的观念。语词并没有一个绝对的固定不变的含义,其意义是在特定语境中通过使用它来体现的。就此而言,因果关系这一概念在不同领域中使用所表现的意思可能是不同的:在日常生活中,就不同于哲学领域,或许也不同于科学意义上的,并因此在法律领域中也会不同,甚至有很大不同。在苏力看来,法律上的“因果关系”,与诸如“自愿”“故意和过失”“正当防卫”等概念一样,都不具有一种自在的性质;都不是本质主义的,而是一种社会和法律制度的建构,其中隐含的是一系列特定的社会公共政策判断或价值判断。


这就带来了与之紧密相关的另一点:社会建构中的语词及其含义,不过是人们为了应对各自特定社会中各种现实问题的副产品而已。人们往往只看到了表面上的词,而没有或不愿看到背后的事。一旦社会环境发生了变化,或社会中的问题发生变化,或者两者同时发生变化时,语词的含义就会随之变化,尽管使用的还是同一个词,变化的程度也各不相同。甚或还会出现这样的情形即当一个语词很难或无法解决或回应生活中的问题时,人们就会用另外的语词来替代先前使用的那个词。本文所讨论的因果关系转向相关关系就是一个例证。在这个意义上,语词间的转变类似于库恩所说的科学理论由常规时期到革命时期进行的范式转换。


可以说,语词的构建、制度的形成以及它们的变化很大程度上来源于社会的变迁,是对社会变迁的回应。马克思唯物史观告诉我们,社会变化的主导力量来源于科学技术发展和发达的水平。我们当下这一特定时代最为突出的特征之一,或许莫过于人们所谓的“大数据时代”。





大数据时代的到来,社会的改变是全方位的。改变了人们的生活、工作,甚至是思维的方式。被誉为“大数据时代的预言家”的著名学者舍恩伯格认为这仅仅只是一个开始。大数据时代对我们的生活,以及与世界交流的方式都提出了挑战。最为惊人的是,社会需要放弃它对因果关系的渴求,而仅需关注相关关系。也就是说,只需要知道是什么,而不需要知道为什么”。这意味着什么?对法律有何影响?



  2  困境的由来


与多数国家法律条文中关于因果关系有直接规定之情形不同的是,从2010年7月1日正式实施的《侵权责任法》第6、7条来看,其本身并没有对因果关系做出直接规定(《民法通则》对此也没有直接规定)。在草案一审稿中曾规定:“受害人应当证明侵害行为与损害后果之间存在因果关系。”只是后来的草案二审稿最终删除了这一规定。立法说明给出的理由是,在征求意见过程中,有人提出因果关系问题较为复杂,草案一审稿的规定较为简单,不足以解决问题,从而在原则上,如何判断因果关系需要由法官根据个案实际情况并依照社会经验决定。


尽管没有明说,这里的所谓复杂性,在笔者看来,或许就是与因果关系的证明有关。没有直接规定因果关系,并不意味侵权责任的承担无须因果关系的存在,因果关系的证明仍然是必需的且由受害人来完成。第6条适用的是过错责任原则,第7条是对无过错责任原则的规定,尽管这一条免除了受害人证明行为人过错的举证责任,但因果关系的证明仍由受害人承担。


那么,如何来证明事实上是否存在因果关系呢?通常的方法,是问一问,“假如没有侵害者的行为,受害者的损害还会发生吗?”也就是所谓的“假若没有”规则(bue for test)。如果回答是否定的,即受害者的损害不会发生就证明了事实上的因果关系的存在。对于大量简单侵权案件来说,这一证明方法的确具有简洁可靠的优点。比方说,行为者将一个燃烧的烟头扔进了废纸篓从而将受害者的房屋烧毁。很显然,如果没有行为者扔烟头这一先前的行为,受害者就不会有后来房屋被烧毁的损害,从而很容易地就能够确定行为与损害之间具有事实上的因果关系。





然而,日常生活中经常发生的问题却是,在两个或多个可能的因果过程之中,究竟是哪一种过程在一个特定场合的具体事例中得到了证明。因而,实践中法院可能要确定的是:疾病是由于吸人有毒气体所造成的,还是由于吃了被污染的食物。换言之,如果要从事实上确定性地证明A是B的原因,必须要同时排除其他诸多潜在的可能原因,比方说,不是C或者D可能导致了B的出现。然而这是非常困难的。任何一个单一事件的发生在特定情形下总是存在着多种多样的可能原因,而且很难或无法穷尽这些可能的原因。在稍微复杂的情况下,例如,在同时原因或取代原因的情形下,简单使用这一证明方法会遇到更多问题。


那么,该如何解决这一事实上因果关系证明上的困难呢?我国立法中的做法之一,是将因果关系的证明责任倒置给侵害者,从而免除受害者对于因果关系的证明责任。例如,《侵权责任法》第66条明确规定,因污染环境发生纠纷,污染者应当就法律规定的不承担责任或减轻责任的情形及其行为与损害之间不存在因果关系承担举证责任。之所以将污染行为与损害之间的因果关系的举证责任分配给污染者,是为了有利于保护受害人的合法权益。因此按理说,这样的立法规定简单明确,受害者胜诉的可能性应该很大。但实践中的情形并非如此。


有学者针对上千份有关环境侵权司法裁判文书的调查结果显示,只有接近50%的裁判文书中,法官自觉运用了举证责任倒置这一证明规则。更令人不解的是,一些文书一边适用举证责任倒置规则,一边仍坚持运用鉴定结论(由第三方来判断)来认定因果关系。在判断侵害行为与损害结果之间的因果关系的问题上,大多依赖于鉴定结论,其他证据的运用明显不足。





但问题是,试图让鉴定机构证明不存在事实上的因果关系,这怎么可能?比如,许多年以前,原告的母亲在怀孕期间购买并使用了被告制造的产品,被告怎么去证明不是他的产品给原告造成了有害结果?因此实践中经常发生的情形是,侵害者往往找不到愿意为其鉴定的鉴定机构。如果严格适用法律中规定的因果关系举证责任倒置的证明规则的话,实践中就不应当出现有因果关系的鉴定结论。但情形却相反,鉴定结论往往在案件裁判中起着决定性的作用,而且发现法官在裁判时对肯定性的因果关系存在的鉴定结论有着过度依赖的偏好,从而在事实上形成消极抵制立法中的制度安排。另外,如果这一证明规则真的如立法者所认为的那样,能有效解决生活中问题的话,我们应该有理由推测出其他国家也会采用这一制度。但实际上西方大多国家并没有采用。


这是为什么?很大程度上,既与“证明”有关,也与“因果关系”有关。在几何或代数的推理中,对于证明结果,人们一般不会发生争议。这是因为结论是从不证自明的公理或是既定预设出发,运用演绎逻辑得出的必然结果而已,关键在于证明的前提是确定性的和肯定性的。


然而在真实世界,我们关于许多事物的知识都不是确定无疑的,总是存在着其他可能性,尤其是当事情变得复杂时,这一点就更为明显。要想得到确定性的证明结果,就必须把所有的其他可能性都排除掉才行。


在这个意义上可以说,证明不同于证实。证实很容易,只需从正面说“是”就行了;而证明却很难,不仅要从正面说“是”,还必须从反面说其他东西“不是”。另外,我们如果把因果关系视为事实上的,就意味着因果关系是一种确定无疑的关于事物之间的必然性关系。但这样一来,困境就出现了:我们如何才能知道某一关系就肯定是确定无疑的?我们根本无法将与之有关的所有信息都收集到。简言之,证明问题的困境来源于知识和信息的缺乏和不确定性,而这从根本上说是因为这个世界本身就是不确定的。确定性只属于逻辑和数学,而不属于事实和事件。



3 观念的转变


传统的法律中的因果关系之所以麻烦不断,主要不是因为这个词本身出了什么问题,从根本上看是由于它无法有效解决现实中的实际问题,从而出现了各种补救或替代措施,证明责任的倒置、因果关系的推定、相当因果关系等都是这一持续努力的结果。在近现代以前的社会,尽管科技不发达,信息也缺乏,但因果关系的观念却得到了很好的适应。这主要是因为当时的社会环境相对简单,事物/事件之间的关联程度并不复杂,基本上处于梅因所说的“静止的社会”,因而,人们通过经验积累而形成的各种法则和知识体系能很好地解决日常问题。


然而,一旦社会结构和组织变得复杂起来,问题就会随之而来:人们不容易知道或发现事件之间的关系究竟是怎么一回事时就无法进行判断和决策,而如果仍然坚守传统的因果关系的信念则会给个人和社会带来巨大的损失。


例如,日本富山的骨痛病案就是一例。早在20世纪初,居住在该地区的人们就发现这一地区的水稻普遍发育不良。到30年代出现了一种怪病,患者大多是妇女。刚开始,患者的腰背肩膝等部位感到疼痛,但后期骨骼出现软化、萎缩并且极易骨折,有些人甚至无法忍受而选择自杀。虽然附近的居民都怀疑是附近矿业排污所致,但当时的医学知识对此无从肯定。这种情形持续到1971年,才由一审法院在判决中认定,该事件时间长空间大,涉及人数多且不特定,因果关系无法证明。最终不得不借助疫因学理论才确认有因果关系,结束了这场持续了近半个世纪的灾难。



在该案中,所谓的确认有因果关系,不过是修辞的策略性使用,关键之处是何为疫因学理论。简单地说,疫因学又称流行病学,指的是一种医学上的研究方法,用于探究某种疾病是由何种病因导致。在具体操作上,要想证明疾病是由某种因素导致的,要有四个条件:第一,某种因素在某种疾病发生前存在着;第二,该因素发挥作用的程度越显著患该病的概率越高;第三,该因素被消除的场合患该病的概率就降低;第四,该因素作为原因其作用机制能够无矛盾地得到生物学上的说明。换句话说,作为原因的事件与作为结果的患病与否及加剧之间呈现出同方向共同变化的趋势:前者增强后者随之增强;前者减弱后者随之减弱。


表面看,这里的疫因学理论,是前文中的盖然性学说的一种具体的证明方法,即只要就因果关系的存在表示出相当程度的盖然性的程度即可。但实际上体现的却是相关关系:如果两个事件之间在一定程度上相随共变或相随共现,两者间就具有相关关系。比方说,中学成绩好的学生,大学学习成绩也好,两者间存在相关。但要注意的是,相关关系是就平均而言,因为很明显,中学成绩好而大学成绩可能不好,或中学成绩不好而大学成绩好的情况时有发生。简言之,相关关系意味着事件之间存在着关系,但这种关系又是不确定的,只存在统计学上的盖然性/可能性。


不仅在医疗卫生,在食品安全、公共交通、环境污染甚至是恐怖活动领域,相关关系都能发挥重要作用。这种作用主要是通过识别有用的关联物来帮助我们分析一个现象。例如,如果数百万条电子医疗记录已显示橙汁和阿司匹林的特定组合可以治疗癌症,那么,找出具体的药理机制就没有这种治疗方法本身来的重要。因此,关键问题是,我们如何才能在如此众多的事物之间准确而快速地找到这些关联物进而发现其中的相关关系呢?


答案是,大数据。大数据首先是一种技术进步以及由此而来的数据以爆炸方式快速增长。在信息社会,每个人的日常生活都在一定程度上被数据化(而不仅仅是数字化),我们浏览网页,使用办公软件,登录社交网络,使用移动工具,进行在线交易等都留下了各式各样的数字痕迹。尤其是在智能手机功能越来越强大且日益低廉的情形下,这一切变得更为方便、普遍和迅速。大数据采集、存储、分析、可视化技术和方法的普及使得对数量巨大、来源分散、格式众多的大数据进行分析成为可能。





当然了,以往的社会也处理和分析数据,但那是小数据,使用的是随机抽样。而在大数据时代,由于有海量的数据,使得全样本(也就是总体)分析变得可能。尽管小数据的随机抽样在多数时候能达到目的,而一旦我们需要知道更深层的细分领域的情况时,随机抽样的方法就不可取了。比方说,经过随机抽样对数据进行分析后,我们得知英语成绩好的同学数学一般也好的结论。但如果我们想进一步知道,根据性别、地域、年龄阶段、家庭经济状况等更为精细的标准划分时结论是否有不同,就会越来越不确定。


当谷歌工程师准确地提前预测到流感爆发的地点、人群和趋势时,并不是依赖于对随机样本的分析,而是分析了整个美国几十亿条互联网的检索记录。更重要的是,随机抽样会因调査者前见或偏见而事先可能将某一事后看来是至关重要的变量遗漏时,误导性的结论就在所难免了。


不仅如此,由因果关系转向相关关系,将会对人们关于知识本身的看法产生重大影响。传统的看法是,知识是确定性的,只有建立在绝对可靠的前提下,我们所获得的知识才有可能是正确的。很显然,这种传统的知识观是与必然性的因果性学说紧密关联,只有当我们发现事物背后的因果机制时,知识才得以建立,科学才得以发展。在简单社会,这种看法并不错,但在复杂社会,如果仍然以该标准来衡量的话,恐怕许多意见就算不上知识,因为复杂性导致的不确定更为常见。一旦由于这些意见不是确定性的知识而被排除在外,那么,人们又将如何应对这个日益复杂且不确定的现代社会?由此可见,只有拓宽传统知识的范围,将不确定性也就是可能性纳人其中,不仅必然性的因果规律重要,盖然性的数据规律(相关关系的规律)也很重要,我们才能做得更好。这就是大数据时代带给我们的观念上的转变。


4 新观念对法律制度的冲击


在众多学者看来,大数据的核心是进行预测,是在过去数据的基础上通过技术处理(主要是回归分析)来预测某一事件即将发生的可能性。尽管回归方程是根据历史资料来进行估计的,但它却可以用于预测未来的情形,而归功于这一点的恰恰是相关关系:如果有大量数据表明两个变量在以往很大程度上是相随共变或相随共现的,那么就有足够的理由确信这两者在未来的情形不会有太大的变化。而且,这是一种有根据的预测(注意这里的限定词是有根据的而非无凭无据),尽管会有出错的可能(这也是为什么称之为预测而非预言)。甚至更为惊奇的是,回归分析技术不仅可以帮助我们做出预测,而且同时也能报告该预测的准确程度如何,也就是能够告诉我们它们对自己的估计有多大的把握(通过置信水平来实现)。


以往的治理逻辑是,先出现了一个问题,然后是进行逻辑分析,构建理论找出其中的因果关系,最后才提出具体解决方案。这是一种类似于事后的“救火模式”。大数据时代的治理逻辑应有所转变,首先是针对问题收集大量数据,然后是进行量化分析,找出其中的相关关系后,提出具体的优化方案。这是一种类似于事前的“防火模式”。


例如,互联网的广泛应用使骗子很容易得手,因为网络交易越便利,实施欺诈的成本也越低,实施欺诈的行为就更多。但预测技术某种程度上可预防欺诈的出现。通过利用交易数据,预测手段能够实时地对交易进行评分和排序,有效提高欺诈识别率。不少大中型金融机构由于有了欺诈识别系统,以此能够对顾客的每一次取款都进行风险评分,从而在事前降低了欺诈带来的潜在损失。





但话又说回来了,甘蔗不能两头甜。大数据的预测给我们带来好处的同时,也带来了更多的威胁,威胁到了我们的自由,身体的、意志的和观念的自由。比方说,对于犯罪和欺诈而言,仅有预测和预防显然是不够的,还必须对其实施严厉的惩罚,因为没有实际的惩罚做保障的话,预防也只是一句空话。


如果我们可以用大数据来预防犯罪,那么,我们进一步对其进行惩罚也是符合逻辑的,因为,尽管我们可以提前阻止其行为的发生,但如果没有相应的惩罚措施跟着,也就毫无威慑可言,那么,犯罪和欺诈就会并仍将会继续发生,预防的目的就彻底落空了。简言之,预防和惩罚罪犯不是因为他们的“所做”,而是因为他们的“将做”。但如此一来,问题就来了:对尚未进行而不过是即将进行犯罪的嫌疑人实施惩罚,更麻烦的是,我们永远也无法证明这个将要受到惩罚的犯罪嫌疑人是否会真的犯罪,尽管他犯罪的可能性非常高。


大数据预测也可能在民事领域给我们带来麻烦,典型的就是隐私权。通常我们可以通过匿名化来有效保护个人隐私,但这对大数据来说没用,因为当数据越来越多的时候,通过结合越来越多不同来源的数据,完全的匿名化根本或很难做到。另外,隐私权往往针对的是人们在家里以及一个封闭的固定场所范围内的私人化的秘密而言。以往的法律无须担心人们出门在外的隐私权,因为一旦到了公共场所,一个陌生化的空间,人们谁也不认识谁。但这种情形正在改变。如果有人试图搞清一个人是谁,只要有个名字,各种与之相关的海量数据就会轻松地获得而知道他的一切;甚至连名字也不用,只需有脸部识别软件就够了。例如,美国马萨诸塞州的警察利用脸部识别软件成功地抓捕到逃犯罗伯特·豪威尔。执法人员从电视节目上拍下他的脸部照片,然后跟900万张驾照数码照片的数据库进行匹配,很快就把他搜了出来。


更令人想不到的是,隐私权保护的是过去和现在的信息,人们不用担心要不要保护其未来的信息,因为未来的信息还不存在呢。可一旦有了数据挖掘技术,就可预测到人们将要做什么,这样就不可避免的威胁到未来的隐私了。这也难怪Sim公司的老板斯科特·麦克尼利曾宣布,我们没有隐私——忘了它。




另外,如果说大数据时代的到来,带给我们的影响是全方位的,从而必将对法律制度造成的冲击也是全方位的,这也不是实话。在笔者看来,这种冲击和影响或许只是边际意义上的(即使这一点或许也只是暂时的),而不是总体的;是部分领域的部分情形,而非所有的法律领域的所有情形。正如学者们所认为的那样,现代社会是一个风险社会,这是现代化、工业化和城市化的副产品。风险的加剧导致的结果就是,对风险的事前预防而不是事后处置就显得更加重要。体现在法律制度领域,就是大规模侵权的兴起。目前,在产品责任、食品安全、环境污染、工业事故、反托拉斯、证据诉讼以及其他有关消费者保护等领域都发生了大规模侵权。关于大规模侵权,学者争议不大,指的是作为特定主体的现代企业所实施的各种侵权行为给大量的受害者造成人身或财产上巨大的损害。


由于损害后果的严重性和范围的广泛性,导致须提供数额巨大的损害赔偿救济,而这又引起对大规模侵权事前预防的高度关注。除了侵权法之外,刑法是另一个重要领域,这其中,如何有效应对恐怖活动是各国所共同高度关注的。如何用统计学的方法来测量恐怖主义,如何辨识恐怖袭击的信号,以及为什么恐怖分子不去炸购物中心?这些重要且有趣的问题,在大数据时代,都是我们所要面对的,并且也都有了一定的解决的基础。


尽管在大数据时代,相关关系作为一种思维或者决策方式已从幕后走向前台,发挥着越来越显著的作用,但这并非意味因果关系概念的彻底抛弃。如果我们不是在确定性的而是在盖然性的意义上来界定和使用这一语词的话,探寻事件/事物之间的因果关系仍然是社会科学工作者所追求的目标,毕竟如果我们不了解事件之间具体作用的因果机制究竟如何,就无法对事件的进程加以事前的支配和控制。重要的不是解释世界而是改造世界。


因果关系还是有用的,只不过将不再被看成是意义来源的基础。我们身处的这个世界日趋复杂,有时复杂的令人难以想象。一旦当我们无法直接且快速地发现事件间的关系时,相关关系或许就是更有用的。相关关系也许不能准确地告知我们某事为何发生,但它会提醒我们这件事正在发生。而在许多情形下,这种提醒的帮助已经足够大了。不仅如此,相关关系还为进一步探究因果关系奠定了基础。但话又说回来了,即使事件之间高度相关,也可能只是纯粹的巧合而已。


但什么时候是巧合,什么时候不是,这都需要我们做出判断;而这个世界更看重的是判断。


5 结语


也许这一切都只不过是正在发生。无论是作为硬的方面的基础设施的大数据,还是作为软的方面的基础性制度的大数据,与西方国家相比较而言,我们都做的远远还不够;相对于其他领域来说,法律这个行当显得更为滞后,不过是冰山一角而已。这其中,或许最为欠缺的是用盖然性的观点看事情,这对于已深深地习惯于用必然性的因果关系看待世界的我们来说,的确是一项艰巨的挑战。


当年,黄仁宇以大历史的视野研究中国历史,认为近代中国落后于西方的一个很重要的因素是,中国未能像西方那样,拥有实行数目字管理的现代治国手段。如今,中国作为大国已经和平崛起,我们正处于大数据时代,国家治理体系和治理能力现代化也已明确提出。笔者有充分理由相信并期待着,中国的未来会更加美好。而这意味着,作为理论工作者,首当其冲的就是,在新的形势和条件下对现有的理论学说进行认真的反思、批评和超越,做出理论上进而是制度上的贡献。法律中的因果关系的理论学说,或许就是其中之一。



看到这里了,分享一下呗~


如果你喜欢我们的推送,请长按下方的二维码,关注我们,谢谢支持!此外,如果你有什么想法,以及对本文的评论,欢迎在下方留言。


继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存